Techniques de fouille de données pour la réécriture de requêtes en présence de contraintes de valeurs
نویسندگان
چکیده
Résumé. Dans cet article, nous montrons comment les techniques de fouilles de données peuvent résoudre efficacement le problème de la réécriture de requêtes en termes de vues en présence de contraintes de valeurs. A partir d’une formalisation du problème de la réécriture dans le cadre de la logique de description ALN (Ov), nous montrons comment ce problème se rattache à un cadre de découverte de connaissances dans les bases de données. L’exploitation de ce cadre nous permet de bénéficier de solutions algorithmiques existantes pour la résolution du problème de réécriture. Nous proposons une implémentation de cette approche, puis nous l’expérimentons. Les premiers résultats démontrent l’intérêt d’une telle approche en termes de capacité à traiter un grand nombre de sources de données.
منابع مشابه
Fouille de données relationnelles dans les SGBD
Les travaux sur la fouille de données relationnelles prennent leur essor dans le domaine de la Programmation Logique Inductive (PLI). Bien qu’efficace en terme d’extraction de connaissances, la PLI est inadaptée pour traiter des bases de données relationnelles de grande taille. Dans cet article nous présentons une nouvelle approche qui apporte une solution efficace à la fouille de données relat...
متن کاملESIEA Datalab Logiciel de Nettoyage et Préparation de Données
Il est communément admis que le temps de préparation des données peut occuper jusqu’à 80% du temps lors d’un projet industriel de fouille de données (Pyle, 1999). L’hétérogénéité des sources, la présence de valeurs manquantes, les erreurs de saisie ou de calcul, les pannes de capteurs, une mauvaise fusion de données sont autant de causes qui peuvent introduire erreurs et incohérences dans une t...
متن کاملDynaClose : Une approche de data mining pour la sélection des index de jointure binaires dans les entrepôts de données
Résumé. L’indexation est l’une des techniques d'optimisation redondantes qui accélère les requêtes OLAP. Deux types d’index sont disponibles : les mono-index (B-tree, index binaire, projection, etc.) et les multi-index (index de jointure). Pour un entrepôt représenté par un schéma en étoile, les index de jointure binaires sont souvent utilisés pour accélérer les requêtes de jointure en étoile c...
متن کاملFouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure
Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en co...
متن کاملMining Frequent Queries in Star Schemes
Résumé. L’extraction de toutes les requêtes fréquentes dans une base de données relationnelle est un problème difficile, même si l’on ne considère que des requêtes conjonctives. Nous montrons que ce problème devient possible dans le cas suivant : le schéma de la base est un schéma en étoile, et les données satisfont un ensemble de dépendances fonctionnelles et de contraintes référentielles. De ...
متن کامل